Nature解读 | 痕量肿瘤组织竟然能判定肺癌术后进展?深度学习再立新功
我承认,在当我看到这篇文章的题目的时候,我还曾经怀疑过它是不是利用空间转录组等技术,在队列样本中进行检测的实验设计,来做一些特定的免疫微环境分型和biomarker鉴定工作。
但是这篇文章用非常solid的研究成果狠狠教育了我一把,能在nature上发表的文章,显然不止是这点儿实力。
Nature的文章通常比较低调,没有Cell系杂志那样醒目好看的Graphical abstract,所以如果一眼扫过去,要到第二页才能看到文章的大致实验设计。
研究将多名患者的非小细胞肺癌肿瘤样本使用CyTOF技术进行了检测,再进行了后续处理,但实际上读了文章才会发现这里使用的是IMC,即成像质谱流式技术Imaging Mass Cytometry。这种技术能对经过金属同位素抗体标记的切片样本进行处理,利用激光每次消融切片上的一个小区域(作为一个像素点),并送入流式质谱中进行检测,最终重建整个组织切片的分子图景(如下图)。
所以呢,这项研究拿到的不仅是细胞中的蛋白丰度信息来做细胞类型鉴定以及细胞丰度分析,更重建了400多例肿瘤样本的空间信息。从概览性的Fig1我们可以看到,除了实验设计之外,这张figure罗列了所获得的各种核心信息:不同类型肿瘤切片中获得的细胞类型及其比例和利用不同标记构建出的肿瘤组织空间图景等。数据共纳入超过160万细胞,用landscape这个单词确实能够担当的起。
接下来作者展开了一系列分析,基于这样一个信息量十分丰富的landscape,能拿到的结论当然也非常多。例如在高级别实体瘤、微乳头组织、腺泡组织、乳头组织和附壁结构等组织中髓系细胞的比例存在明显的差异,而淋巴细胞的占比并没有显著差异;巨噬细胞和T细胞在非小细胞肺癌的免疫微环境中存在着可能的相互作用;B细胞的占比与肿瘤患者的预后存在正相关关系;以及CD4+T细胞中的ERK信号传导与生存期延长相关等等,但是这些都不是最重要的要点。
作者根据空间中的细胞分布和比例提取数学特征,将区域分类成了不同的cellular neighbourhood(我想大概能翻译成细胞邻接空间?),即CN,不同的CN具有不同的特征,例如在取CN的数量为30进行解析的时候,各个CN的marker丰度如下,我们可以看到作者将B细胞富集的CN标注为了灰色,在辅助材料中也提供了B细胞富集非常有利于肿瘤预后的证据。
当然,最重要的发现到现在还没有揭晓,从上面基于CN的分析我们明白了,肿瘤免疫微环境中的免疫特征与肿瘤的预后是具备极强的关联性的,那么这种关联性有没有可能应用到肿瘤预后的预测中来呢?如果可以,那么以什么样的方式来进行呢?对于这种维度不算特别高但是数据量可称海量的数据,我们怎么才能够以有效的方式将它应用起来呢?
到这里,作者果断祭出了神经网络模型大杀招,对质谱图像使用深度残差网络(Deep residual network, ResNet)模型进行处理,并且使用谱系标记lineage markers的空间位置作为处理对象,构建了用于预测肿瘤预后的数学模型(只用细胞比例预测效果不好,而使用全部marker精度又基本没有提升)。
更惊人的来了,作者使用1mm2的肿瘤组织(小于穿刺面积)进行分析后作为输入数据,进行肺癌患者术后进展的预测,竟然在使用了CD14、CD16、CD94、αSMA和CD117(CN23的富集marker)组合时达到了90.8%的accuracy,而在进一步加入CD20后,达到了93.3%的accuracy和95.6%的precision and recall!对于使用微创样本进行的预测而言,实在是一个非常高的精度了。这里不是简单将数据粗暴地输入模型来进行训练,而是基于前面开展的cellular neighbourhood相关的研究一脉相承,最终得到了一个具有重要意义的模型,而模型的背后,则是免疫微环境对肿瘤作用与影响的深入机制,仍等着我们一步步去揭示。
相关阅读
温故知新:空间转录组——简单的研究方法带来不简单的研究成果
干货 | 空间转录组专题(20230310更新)
高分用户文章探究小胶质细胞-星形胶质细胞在脑出血中的作用机制|空间转录组专题
点击下方图片进入云平台资料汇总:
所见即所得,绘图高规格联川云平台,让科研更自由